Bandits Multi-Brazo con Nuevos Brazos: Arrepentimiento Dinámico Optimiza experimentos con llegada de nuevas opciones: el algoritmo UCB-AA ofrece arrepentimiento dinámico sublineal y reduce desperdicio de recursos. 2026-06-09 · 2 min